Proyecto 1 - Visualización de Información

Elaborado por:

Jennifer Alvarado Brenes - 2020124171

Daniel Cornejo Granados - 2019018538

library(readxl)
library(ggplot2)
library(plotly)
library(tidyr)
library(patchwork)

# Load the data
data <- read_excel("CasosCOVID.xlsx", sheet=2)
data$FECHA <- as.Date(data$FECHA)

Casos de COVID-19 en Costa Rica

A continuacion se presentan los datos recopilados desde abril 2020 hasta mayo 2022 sobre los casos de COVID-19 en Costa Rica

Casos positivos

Se presenta la cantidad de casos positivos de COVID-19 en Costa Rica desde abril 2020 hasta mayo 2022.

En este caso es posible observar un comportamiento con tendencia lineal en la cantidad de casos positivos de COVID-19 en Costa Rica, aunque durante los años en los que se recopilaron los datos podemos notar algunas gradas es posible afirmar que el comportamiento fue mayormente lineal.

casos_positivos <- ggplot(data, aes(x=FECHA, y=positivos)) + geom_line() + theme_minimal() + theme_bw() + labs(title="Casos positivos de COVID-19 en Costa Rica", x="Fecha", y="Casos positivos")
ggplotly(casos_positivos)

Casos activos

Se presenta la cantidad de casos activos de COVID-19 en Costa Rica desde abril 2020 hasta mayo 2022. Podemos notar un comportamiento común de jorobas en la cantidad de casos activos, este comportamiento se podria decir que fue por las medidas de restricción sanitaria que se tomaron en el país.

casos_activos <- ggplot(data, aes(x=FECHA, y=activos)) + geom_line() + theme_minimal() + theme_bw() + labs(title="Casos activos de COVID-19 en Costa Rica", x="Fecha", y="Casos activos")
ggplotly(casos_activos)

Casos hospitalizados

La cantidad de casos hospitalizados no parecen demasiados a simple vista de los ejes, sin embargo es nesesario tener en cuenta la cantidad de espacios con los que cuenta cada hospital para todos sus pacientes, por lo que la cantidad de casos hospitalizados no es un dato menor. Durante la extension de los datos podemos notar el parecido con los casos activos, en especial podemos notar la acentuacion de las jorobas de julio 2021, donde se presentaron los picos mas altos de casos hospitalizados.

casos_hospitalizados <- ggplot(data, aes(x=FECHA, y=hospital)) + geom_line() + theme_minimal() + theme_bw() + labs(title="Casos hospitalizados de COVID-19 en Costa Rica", x="Fecha", y="Casos hospitalizados")
ggplotly(casos_hospitalizados)

Casos de muertes por género

A continuación, podemos ver el comportamiento de las muertes por COVID-19 en Costa Rica. En este caso, se presentan los datos por género, donde podemos notar que la cantidad de muertes en hombres es mayor que en mujeres. Sin embargo, la diferencia no es tan grande como se podría esperar. En general, podemos observar un comportamiento lineal en la cantidad de muertes por COVID-19 en Costa Rica, y cómo a lo largo del tiempo la diferencia de muertes entre hombres y mujeres se incrementa parcialmente.

names(data)[names(data) == "muj_fall"] <- "Mujeres_fallecidas"
names(data)[names(data) == "hom_fall"] <- "Hombres_fallecidos"

casos_fallecidos <- pivot_longer(data, cols = c(Mujeres_fallecidas, Hombres_fallecidos), names_to = "Genero", values_to="Fallecidos")

fallecidos_genero <- ggplot(casos_fallecidos, aes(x=FECHA, y=Fallecidos)) + geom_line(aes(color=Genero))+theme_minimal() + theme_bw() + labs(title="Fallecidos por COVID-19 en Costa Rica", x="Fecha", y="Fallecidos") + scale_color_manual(values=c("blue", "red"))
ggplotly(fallecidos_genero)

Casos de recuperaciones por género

En este caso, se presentan los datos de recuperaciones por COVID-19 en Costa Rica. Se muestran los datos por género, donde se puede observar que la cantidad de recuperaciones en hombres es prácticamente la misma que en mujeres, excepto por una anomalía en los datos para la fecha del 9 de junio de 2021. En general, se puede observar un comportamiento lineal en la cantidad de recuperaciones por COVID-19 en Costa Rica, y cómo a lo largo del tiempo la diferencia de recuperaciones entre hombres y mujeres se mantiene similar, aunque al final del diagrama se nota un aumento en la recuperación de las mujeres en comparación con los hombres.

names(data)[names(data) == "MUJ_RECUP"] <- "Mujeres_recuperadas"
names(data)[names(data) == "HOM_RECUP"] <- "Hombres_recuperados"

casos_recuperados <- pivot_longer(data, cols=c(Mujeres_recuperadas,Hombres_recuperados), names_to="Genero", values_to="Recuperados")


recuperados_genero <- ggplot(casos_recuperados, aes(x=FECHA, y=Recuperados/100)) + 
geom_line(aes(color=Genero)) + 
theme_minimal() + theme_bw() + 
scale_color_manual(values = c("blue", "red")) +
labs(title="Recuperados por COVID-19 en Costa Rica", x="Fecha", y="Recuperados")

ggplotly(recuperados_genero)

Evolución de casos

Se visualiza la evolución de los casos de COVID-19 en Costa Rica referentes a las categorías de casos positivos, fallecidos, hospitalizados, hospitalizados en el área de UCI (Unidad de Cuidados Intensivos) y casos recuperados, entre abril 2020 y mayo 2022.

Se puede observar que en mucha mayor medida, hay casos positivos y recuperados, ya que no todas las personas que fueron contagiadas en algún momento murieron, fueron hospitalizadas o llegaron a la UCI. Estas últimas tres categorías representan una minoría en comparación a la gran cantidad de casos positivos y posteriormente, recuperados. Es fácil de visualizar en esta gráfica de áreas apiladas, que entra en la categoría de gráfica multidimensional.

data_long <- pivot_longer(data, cols = c("positivos", "fallecidos", "hospital", "UCI", "RECUPERADOS"),names_to = "Variable", values_to = "Valor")
evolucion_casos <- ggplot(data_long, aes(x = FECHA, y = Valor, fill = Variable)) + geom_area() + labs(title = "Evolución de Casos COVID-19", x = "Fecha", y = "Cantidad", fill = "Variable") + theme_minimal()
ggplotly(evolucion_casos)

Casos de covid en adultos vs menores de edad

La población de personas menores de edad se vio afectada en mucha menor medida que la población de adultos, dato que es lógico ya que los adultos deben salir más de casa y los menores son una población altamente resguardada y cuidada.

Se puede observar un menor volumen de los datos en los menores de edad en la siguiente gráfica de facetas.

names(data)[names(data) == "positivos"] <- "Positivos"
names(data)[names(data) == "adul_posi"] <- "Adultos"
names(data)[names(data) == "menor_posi"] <- "Menores"
data_long <- pivot_longer(data, cols = c("Positivos", "Adultos", "Menores"), names_to = "Grupo de Casos", values_to = "Cantidad")
facetas_casos <- ggplot(data_long, aes(x = FECHA, y = Cantidad, color = `Grupo de Casos`)) + geom_line() + labs(title = "Evolución de Casos COVID-19", x = "Fecha", y = "Cantidad", color = "Grupo de Casos") + facet_wrap(~ `Grupo de Casos`, scales = "free_y") + theme_minimal()
ggplotly(facetas_casos)

Resumen de casos

Para el análisis de los datos es necesario hacer comparaciones de todas sus categorías. Aquí se muestran algunas, como los datos para los casos positivos, casos activos y casos hospitalizados entre abril de 2020 y mayo de 2022.

Se puede visualizar una correlación entre los casos activos y los casos hospitalizados, ya que estos calzan con los picos de personas contagiadas durante la pandemia. Por otro lado, los casos positivos siempre son crecientes.

Puede visualizarse de forma completa en la siguiente imagen compuesta, en donde el primero corresponde a casos positivos, el segundo a casos activos y el tercero a casos hospitalizados.

casos_positivos <- ggplot(data, aes(x=FECHA, y=positivos)) + geom_line() + theme_minimal() + theme_bw()
casos_activos <- ggplot(data, aes(x=FECHA, y=activos)) + geom_line() + theme_minimal() + theme_bw()
casos_hospitalizados <- ggplot(data, aes(x=FECHA, y=hospital)) + geom_line() + theme_minimal() + theme_bw()
grafico_compuesto <- subplot(casos_positivos, casos_activos, casos_hospitalizados, nrows = 3)
ggplotly(grafico_compuesto)